数组类型¶

from numpy import *

之前已经看过整数数组和布尔数组，除此之外还有浮点数数组和复数数组。

复数数组¶

产生一个复数数组：

a = array([1 + 1j, 2, 3, 4])

Python会自动判断数组的类型：

a.dtype

dtype('complex128')

对于复数我们可以查看它的实部和虚部：

a.real

array([ 1.,  2.,  3.,  4.])

a.imag

array([ 1.,  0.,  0.,  0.])

还可以设置它们的值：

a.imag = [1,2,3,4]

查看 a：

a

array([ 1.+1.j,  2.+2.j,  3.+3.j,  4.+4.j])

查看复共轭：

a.conj()

array([ 1.-1.j,  2.-2.j,  3.-3.j,  4.-4.j])

事实上，这些属性方法可以用在浮点数或者整数数组上：

a = array([0.,1,2,3])
a.dtype

dtype('float64')

a.real

array([ 0.,  1.,  2.,  3.])

a.imag

array([ 0.,  0.,  0.,  0.])

a.conj()

array([ 0.,  1.,  2.,  3.])

但这里，虚部是只读的，并不能修改它的值：

# 会报错
a.imag = [1,2,3,4]

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-13-3db28f506ec9> in <module>()
      1 # 会报错
----> 2 a.imag = [1,2,3,4]

TypeError: array does not have imaginary part to set

指定数组类型¶

之前已经知道，构建数组的时候，数组会根据传入的内容自动判断类型：

a = array([0,1.0,2,3])

对于浮点数，默认为双精度：

a.dtype

dtype('float64')

查看所用字节（8 bytes * 4）：

a.nbytes

32

当然，我们也可以在构建的时候指定类型：

a = array([0,1.0,2,3],
         dtype=float32)

此时类型为单精度浮点数：

a.dtype

dtype('float32')

查看所用字节（4 bytes * 4）：

a.nbytes

16

除此之外，还可以指定有无符号，例如无符号整数：

a = array([0,1,2,3],
         dtype=uint8)
a.dtype

dtype('uint8')

uint8 只使用一个字节，表示 0 到 255 的整数。

还可以从二进制数据中读取。

先写入二进制数据：

a = array([102,111,212], 
          dtype=uint8)
a.tofile('foo.dat')

从数据中读入，要指定类型：

b = frombuffer('foo', 
               dtype=uint8)
b

array([102, 111, 111], dtype=uint8)

清理数据文件：

import os
os.remove('foo.dat')

0-255 的数字可以表示ASCⅡ码，我们可以用 ord 函数来查看字符的ASCⅡ码值：

ord('f')

102

ord('S')

83

Numpy 类型¶

具体如下：

基本类型	可用的Numpy类型	备注
布尔型	`bool`	占1个字节
整型	`int8, int16, int32, int64, int128, int`	`int` 跟C语言中的 `long` 一样大
无符号整型	`uint8, uint16, uint32, uint64, uint128, uint`	`uint` 跟C语言中的 `unsigned long` 一样大
浮点数	`float16, float32, float64, float, longfloat`	默认为双精度 `float64` ，`longfloat` 精度大小与系统有关
复数	`complex64, complex128, complex, longcomplex`	默认为 `complex128` ，即实部虚部都为双精度
字符串	`string, unicode`	可以使用 `dtype=S4` 表示一个4字节字符串的数组
对象	`object`	数组中可以使用任意值
Records	`void`
时间	`datetime64, timedelta64`

任意类型的数组：

a = array([1,1.2,'hello', [10,20,30]], 
          dtype=object)

乘法：

a * 2

array([2, 2.4, 'hellohello', [10, 20, 30, 10, 20, 30]], dtype=object)

类型转换¶

转换数组的类型：

a = array([1.5, -3], 
         dtype=float32)
a

array([ 1.5, -3. ], dtype=float32)

asarray 函数¶

使用 asarray 函数：

asarray(a, dtype=float64)

array([ 1.5, -3. ])

asarray(a, dtype=uint8)

array([  1, 253], dtype=uint8)

asarray 不会修改原来数组的值：

a

array([ 1.5, -3. ], dtype=float32)

但当类型相同的时候，asarray 并不会产生新的对象，而是使用同一个引用：

b = asarray(a, dtype=float32)

b is a

True

这么做的好处在与，asarray 不仅可以作用于数组，还可以将其他类型转化为数组。

有些时候为了保证我们的输入值是数组，我们需要将其使用 asarray 转化，当它已经是数组的时候，并不会产生新的对象，这样保证了效率。

asarray([1,2,3,4])

array([1, 2, 3, 4])

astype 方法¶

astype 方法返回一个新数组：

a.astype(float64)

array([ 1.5, -3. ])

a.astype(uint8)

array([  1, 253], dtype=uint8)

astype也不会改变原来数组的值：

a

array([ 1.5, -3. ], dtype=float32)

另外，astype 总是返回原来数组的一份复制，即使转换的类型是相同的：

b = a.astype(float32)
print a
print b

[ 1.5 -3. ]
[ 1.5 -3. ]

a is b

False

view 方法¶

a = array((1,2,3,4), dtype=int32)
a

array([1, 2, 3, 4])

view 会将 a 在内存中的表示看成是 uint8 进行解析：

b = a.view(uint8)
b

array([1, 0, 0, 0, 2, 0, 0, 0, 3, 0, 0, 0, 4, 0, 0, 0], dtype=uint8)

a[0] = 2**30
a

array([1073741824,          2,          3,          4])

修改 a 会修改 b 的值，因为共用一块内存：

b

array([ 0,  0,  0, 64,  2,  0,  0,  0,  3,  0,  0,  0,  4,  0,  0,  0], dtype=uint8)